Business performance analysis


Introducción

En el presente trabajo se abarcarán algunas de las funciones más básicas de R. La aplicación de las funciones está delimitada por los datos que se analizarán. Es por esto que la selección de los datos tendrá como objetivo posibilitar el uso de la mayor cantidad de funciones, prioritariamente “webscraping”, representación de información geográfica y la obtención de información por medio de APIS.


Expresiones regulares

A continuación se estudiarán las expresiones regulares de las siguientes páginas:

En este sitio web se explica de forma muy sencilla qué es una expresión regular. En resumen diferencia las expresiones regulares de las cadenas de caracteres exactas en que, la expresion regular utiliza tanto caracteres literales como metacaracteres para realizar una búsqueda de patrones de texto. El carácter literal coincide con la ocurrencia del caracter, mientras que el metacarácter va servir de delimitador de la búsqueda.

Para concluir el autor hace una tabla de algunas expresiones regulares, que en mi criterio es muy básica.

En esta página no se brinda una definición de lo que son las expresiones regulares, sin embargo, realiza una lista de funciones de R que se ejecutan utilizando expresiones regulares. El autor expone algunas funciones de manipulación de texto de R que utilizan expresiones regulares, como por ejemplo:

+ Paste
+ Strsplit
+ Chartr
+ Gsub

Además, incluye otras funciones de búsqueda, tales como:

+ Grep
+ Regexpr

El autor finaliza con una tabla muy completa en la que en tres columnas expone la sintaxis de la expresión, hace una descripción de la expresión regular y brinda un ejemplo (si aplica). Abarca expresiones regulares compredidos únicamente por metacaracteres (^, |, •, $), y otras muy comunes comprendidas por caracteres literales y metacaracteres (a+, a{2,4}?, [A-Z]…).


Markdown

En este apartado sobre markdown es conveniente mencionar que existe mucha información en la web acerca del uso de markdown y los textos se encuentran tanto en inglés como en español, por lo que ante una duda existen muchas fuentes de consulta, sin embargo, la información suele ser para un usuario principiante.

En el sitio web previamente mencionado el autor explica de una forma muy sencilla qué es, para qué se utiliza y las razones por las cuales se debe utilizar markdown. Luego, se estudia la sintaxis donde explica los elementos básicos de este lenguaje, los ejemplifica y da una vista previa del resultado en markdown. Además, menciona los que en su criterio, son los mejores editores de markdown y brinda una descripción básica de cada uno. Por último, decribe Multimarkdown como la alternativa cuando se requieren más funciones y mencionas cuatro funciones de esta herramienta.

Esta fue la página web más completa de markdown que encontré. El autor abarca aspectos que van desde qué es markdown, por qué se recomienda usarlo, cómo tranforma los textos, hasta su uso para escribir un libro eléctronico, presentación o correos electrónicos.

Además, incluye la sintaxis básica y extendida de esta herramienta, menciona una lista de aplicaciones y componentes que soportan markdown, y sugiere un libro de consulta Markdown Guide Book.

Para finalizar, la web contiene muchos enlaces donde se obtiene un manual de uso de las aplicaciones con las que markdown es compatible.


Análisis de datos

A continuación se presentarán los datos de criminalidad de Inglaterra y Wales por el mes de setiembre.

constituency country population land_area asb burglary robbery vehicle violent shoplifting cda other_theft drugs bike_theft theft_from_person weapons order other total
Cities of London and Westminster England 122923 1639.86 1017 333 324 242 875 398 217 1809 250 142 1294 33 233 57 7224
Leeds Central England 152847 3600.60 457 207 64 238 1056 278 284 329 102 66 123 40 302 73 3619
Holborn and St Pancras England 154210 1319.75 681 204 147 166 455 97 78 724 127 116 487 14 135 16 3447
Birmingham, Ladywood England 146279 2585.38 355 148 176 224 903 176 162 266 80 23 94 32 182 27 2848
Liverpool, Riverside England 131888 2450.43 402 88 43 123 603 157 137 205 295 83 132 22 180 17 2487
Bermondsey and Old Southwark England 144175 1042.17 478 111 159 111 384 50 83 431 126 66 325 11 103 9 2447
Newcastle upon Tyne Central England 102253 2323.15 684 54 12 69 552 182 193 205 95 43 85 30 190 31 2425
Middlesbrough England 95892 2912.74 656 128 26 129 607 161 244 135 66 18 16 11 150 52 2399
Bethnal Green and Bow England 146820 916.28 707 190 84 168 368 44 88 244 111 86 95 7 108 14 2314
West Ham England 185200 1734.72 419 113 98 179 509 149 120 236 175 34 142 16 90 20 2300
Bristol West England 138885 1724.69 567 84 44 164 493 151 119 181 36 99 45 7 238 14 2242
Sheffield Central England 130085 2135.64 381 160 55 169 420 150 121 182 44 39 84 19 194 45 2063
Tottenham England 142569 1313.52 435 112 188 251 459 55 85 147 84 19 96 19 79 19 2048
Derby South England 115414 3121.97 454 85 32 82 677 95 157 118 60 35 34 18 157 40 2044
Nottingham South England 118722 3256.79 589 135 27 67 384 160 130 138 151 58 54 19 91 32 2035
Bradford West England 117969 3606.89 310 70 27 84 784 92 143 128 52 7 36 9 221 55 2018
Hackney South and Shoreditch England 134550 998.92 362 141 93 135 356 61 82 197 71 94 248 12 91 14 1957
Nottingham East England 109797 1870.27 475 78 29 86 451 138 116 148 101 23 67 24 116 53 1905
Islington South and Finsbury England 118926 748.68 351 115 66 154 290 85 79 259 80 77 252 6 65 18 1897
Vauxhall England 122334 856.99 419 115 68 116 360 57 49 317 72 44 136 21 71 9 1854

De la tabla anterior vamos a comprobar si la siguiente hipótesis es verdaddera:“Existe alguna relacion entre la cantidad de habitantes y el total de crímenes”. Es decir, ¿La cantidad de crímenes de una ciudad es proporcional a la cantidad de habitantes que lo habitan? Si esto es cierto, las ciudades con un mayor número de habitates deberían presentar un mayor número de crímenes, lo contrario, se vería reflejado en las ciudades con menos habitantes.

Para ello, vamos a filtar las tres ciudades con menor y mayor cantidad de habitantes y estudiar la relación Cantidad de población-Crímenes por medio de una gráfica.

constituency country population land_area asb burglary robbery vehicle violent shoplifting cda other_theft drugs bike_theft theft_from_person weapons order other total
10 West Ham England 185200 1734.72 419 113 98 179 509 149 120 236 175 34 142 16 90 20 2300
26 Poplar and Limehouse England 161144 1060.62 557 92 52 191 339 43 83 146 59 28 48 10 83 8 1739
34 Blackpool South England 79725 2022.67 514 63 11 78 401 100 116 154 29 15 25 10 70 15 1601
60 East Ham England 162796 1887.64 273 91 48 120 328 58 79 102 147 9 61 7 86 30 1439
61 Kingston upon Hull West and Hessle England 86690 2373.29 223 107 18 74 404 127 133 90 37 46 8 7 134 26 1434
74 Redcar England 87215 7245.45 502 50 7 55 299 124 159 63 12 6 5 5 69 35 1391

Como podemos observar en la gráfica, la tendencia sí es que a un mayor nivel de población se dé una mayor tasa de criminalidad, sin embargo, esta no es la regla. Las tres ciudades con menor cantidad de población presentan una menor cantidad de crímenes y lo contrario sucede con las ciudades de West Ham y Poplar and Limehouse. Pero cuando nos detenemos a observar East Ham, se infiere que a pesar de la gran cantidad de población presenta una cantidad baja de crímenes. La causa de esto se puede explicar a que la cantidad de población no es el único factor que incide en la cantidad de crímenes, tales como: Ingresos de los habitantes de la ciudad, nivel de estudios, entre otros.

A continuación vamos a estudiar el total de registros de cada crimen:

variable total
12 weapons 1262
14 other 2481
10 bike_theft 3298
3 robbery 3808
9 drugs 5754
11 theft_from_person 5970
2 burglary 9145
6 shoplifting 9477
13 order 10802
7 cda 12012
4 vehicle 12023
8 other_theft 15070
1 asb 34355
5 violent 43093
15 total 168550

De la tabla anterior se concluye que los 5 crímenes con más registros son: violent, asb, other theft, order, vehicle.

A continuación vamos a localizar en el mapa la ciudad con mayor cantidad de registros de criminalidad: West Ham

Por medio de la API de la policia del Reino Unido se pueden recuperar los crímenes registrados en un radio de una milla de un punto seleccionado. En la siguiente tabla se muestran los crímenes registrados como violent-crime en West Ham.

category location_type month
25 violent-crime Force 2019-10

Como podemos ver del crímen violent_crime tiene 134 registros dentro de un rango de una milla del punto latitud= 51.5 y longitud= 0.0125


Conclusión

Al realizar este trabajo fui testigo de la difícil tarea de segmentar las grandes cantidades de información que se obtienen de internet, tanto de datos de algún tema en específico como de los recursos de markdown. La escogencia de la información se basó en su utilidad para el uso de APIS, webscraping y mapas de google, cuyo uso, fue uno de los objetivos principales de este trabajo y no el análisis de los mismos.

Para concluir, con este proyecto se hizo un repaso de algunas funciones básicas de R y markdown. Lejos de ser una presentación de las funciones principales, la ejecución de este proyecto sirvió para investigar la gran canbtidad de funciones que permiten ambas herramientas.